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(S) Promoteur de levure et son utilisation. 

© L'invention concerne des sequences d'ADN 
comprenant tout ou partie du promoteur du 
gene PGK de K.lactis , ou d'un derive de celui-ci, 
et possedant une activite de promoteur trans- 
criptionnel. Elle concerne 6galement ('utilisa- 
tion de ces sequences pour ('expression de 
genes recombines. 



Ndel 



Hindlll 
Sail 
Xbal 



PGKK.1 




< 

CM 




Aflll 
Hindlll 



EcoRV 



Sad 
Xbal 



m 
o 

0. 

LU 



r I CURE 3 



Jouve, 18, rue Saint-Denis, 75001 PARIS 



1 



EP0 511 912 A1 



2 



La presente invention concerne le domaine de la 
biologie moleculaire. Plus particulierement, elle 
concerne une nouvelle sequence d'ADN pr6sentant 
une activite de promoteur transcriptionnel, des vec- 
teurs d'expression contenant cette sequence, et son 
utilisation pour la production de proteines, et par 
exemple de proteines heterologues. L'invention 
concerne aussi les cellules recombinees contenant 
cette sequence d'ADN. 

Les prog res accomplis dans le domaine de la bio- 
logie molecuiaire ont permis de modifier des microor- 
ganismes pour leur fatre prod u ire des proteines hete- 
rologues. En particulier, de nombreuses etudes gene- 
tiques ont porte sur la bacterie E. coli. Toutefois, rap- 
plication industrielle de ces nouveaux modes de pro- 
duction est encore Hmitee, en particulier par les pro- 
blemes d'efficacite d'expression des genes dans ces 
microorganismes recom bines. Aussi, dans le but 
d'augmenter les performances de ces systemes de 
production, des recherches ont ete effectuees afin 
d'isoler des promote urs forts, permettant d'obtenir 
des nrveaux el eves d'expression de proteines hetero- 
logues. Chez E.coli , on peut citer en particulier les 
promoteurs des operons tryptophane et lactose. 

Plus recemment, chez la levure S. cerevisiae , 
des etudes ont porte sur des promoteurs derives de 
genes impliques dans la glycolyse. On peut citer no- 
tamment les travaux sur le promoteur du gene de la 
3-phosphoglycerate kinase PGK (Dobson et al., Nu- 
cleic Acid Res. 10, 1982, 2625 ; Hitzeman et al., Nu- 
cleic Acid Research 1 982, 779 1 ), sur celui du gene de 
la glyceraldehyde-3-phosphate dehydrogenase 
GAPDH (Holland et al., J.Biol.Chem. 254, 1979, 
9839 ; Musti et al., Gene 25, 1983, 133), sur celui du 
gene de I'alcool dehydrogenase 1 ADH1 (Ben- 
nentzen et al., J.Biol.Chem. 257 , 1982, 3018 ; Denis 
et al., J.Biol.Chem. 25, 1983, 1165), ou sur celui du 
gene de I'enolase 1 ENQ1 (Uemura et al., Gene 45, 
1986, 65). 

Recemment, des outils g§netiques ont ete deve- 
lop pes afin de se servir de la levure Kluyveromyces 
comme cellule note pour la production de proteines 
recomb in antes. La mise en evidence d'un plasmide 
de type 2-micron originaire de K-drosophilarum (plas- 
mide pKD1 - EP 241 435) a permis d'etablir un syste- 
me h6te/vecteur tres efficace pour la production de 
proteines recombinantes (EP 361 991). Cependant, 
les promoteurs utilises dans ce systeme n'ont jamais 
ete optimises. En particulier, il s'agit essentiellement 
de promoteurs heterologues, c'est-a-dire prove nant 
d'autres microorganismes, tel que notamment S. cere- 
visiae . Cette situation peut engendrer differents in- 
convenients, et notamment limiterl'activite du promo- 
teur a cause de I'absence de certains elements de la 
machinerie transcriptionnelle (par exemple de trans- 
activateurs), presenter une certainee toxicite pour la 
cellule hdte due a une absence de regulation, ou af- 
fecter la stability du vecteur. 



Dans ces conditions, le manque de promoteurs 
homologues forts chez Kluyveromyces constitue un 
facteur iimitant dans ('exploitation industrielle de ce 
systeme d'expression. 

5 La Demanderesse a maintenant identified clone et 

sequence une region du genome de Kluyveromyces 
lactis pr^sentant une activite de promoteur trahscrip- 
tionnel (voir figure 1). Plus precisement, cette region 
correspond au promoteur du gene PGK de K. lactis . 

10 Cette region, ou des derives ou fragments de celle-ci, 
peut etre utilisee de maniere tres performante pour la 
production de proteines recombinantes chez les levu- 
res du genre Kluyveromyces . II est entendu que cette 
sequence peut egalement etre utilisee dans d'autres 

is organ is mes notes. 

Par ailleurs, ['analyse de la region du genome de 
Kluyveromyces obtenue a permis de mettre en evi- 
dence 2 phases de lecture dans les 2 orientations op- 
poshes (voir figure 2). Cette observation indique que 

20 le brin complementaire de la region presentee sur la 
figure 1 possede egalement une activite promotrice 
agissant dans I'autre orientation. 

Un objet de la presente invention reside done 
dans une sequence d'ADN comprenant tout ou partie 

25 de la sequence presentee a la figure 1 ou de son brin 
complementaire, ou d'un derive de celles-ci f et pos- 
sedant une activite de promoteur. 

Au sens de la presente invention, on entend par 
deriv§, toute sequence obtenue a partir de la sequen- 

30 ce don nee dans la figure 1 par modifications structu- 
rales (mutations, deletions, substitutions, additions, 
fragmentations ... ) conservant une activite de promo- 
teur. En particulier, les mutations peuvent porter sur 
un ou pi us ie urs nucleotides, et les additions et/ou 

35 substitutions peuvent porter sur des elements de re- 
gulation, ou des regions activatrices telles que les 
"UAS". 

Lorsqu'un derive est realise, son activite de pro- 
moteur transcriptionnel peut Stre mise en evidence de 
40 plusieurs fagons, et en particulier en placant sous le 
control e de la sequence etudiee, un gene de resistan- 
ce ou un marqueur de complementation. Toute autre 
technique connue de Thomme de Tart peut bien evi- 
demment etre utilisee a cet effet. 
45 Un objet plus particulier de l'invention concerne 

une sequence d'ADN correspondant a la region 
comprise entre les 2 phases ouvertes ORF PGK et 
ORF X, telle que presentee sur la figure 6. 

Un autre objet de l'invention concerne un ADN re- 
so combinant comprenant une sequence d'ADN telle 
que definie ci-dessus. 

Cet ADN recombinant peut contenir par exemple 
la sequence promotrice presentee a la figure 1 ou un 
derive de celle-ci, dans laquelle est insure un site de 
55 restriction, facilitant I'utilisation de cette sequence 
comme promoteur, "portable". 

Preferentiellement, cet ADN recombinant 
contient en outre un ou plusieurs genes de structure. 
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Encore plus preferentiellement, I'ADN recombi- 
nant contient egalement des signaux permettant la 
secretion du produit d'expression du ou desdits genes 
de structure. 

Dans un mode de realisation particulier de Tin- 
vention, I'ADN recombinant fait partie d'un plasmide 
d'expression, qui peut etre a replication autonome ou 
integrate. 

En particulier, des vecteurs a replication autono- 
me peuvent etre obtenus en utilisant des sequences 
a replication autonomes (ARS) chez I'h&te choisi. No- 
tamment, chez la levure, il peut s'agird'origines de re- 
plication derivees de plasmides connus (pKD1, 2u., 
etc). 

Les vecteurs integratifs peuvent Stre obtenus no- 
tamment en utilisant des sequences homologues a 
certaines regions du genome de I'hdte, permettant, 
par recombinaison homologue, ('integration du vec- 
teur. 

La sequence presentee sur la figure 1 a ete ob- 
tenue par criblage d'une banque d'ADN genomique 
total de Kluyveromyces lactis au moyen d'une sonde 
heterologue provenant du gene PGK de S. cerevisiae . 
La Demanderesse a en effet montre qu'il est possible 
de doner une region promotrice chez Kluyveromyces , 
par hybridation a partir de sondes heterologues 
correspondant a un gene de S. cerevisiae . Les details 
du clonage de la sequence sont donnes dans les 
exemples. La region intergenique peut ensuite §tre 
isolee a partir de cette sequence, notamment par in- 
sertion de sites de restriction en utilisant la technique 
d'amplification par PCR comme indique dans les 
exemples. 

Un autre objet de I'invention concerne les cellules 
recombin£es contenant une sequence d'ADN telle 
que definie ci-avant 

Avantageusement, les cellules sont choisies par- 
mi les levures, et encore plus preferentiellement, par- 
mi les levures du genre Kluyveromyces . II est entendu 
cependant que I'invention couvre toute les cellules re- 
combinees dans lesquelles les regions promotrices 
de I'invention sont actives. 

Ces cellules peuvent etre obtenues par toute me- 
thode permettant d'introduire un ADN etranger dans 
une cellule. II peut s'agir notamment de transforma- 
tion, §lectroporation, ou toute autre technique connue 
de rhomme de Tart. 

Un autre objet de ('invention concerne ('utilisation 
d'une sequence telle que precedemment definie pour 
I'expression de genes recombines. 

Comme I'illustrent les exemples, les sequences 
d'ADN selon ('invention permettent en effet une pro- 
duction a des niveaux elev6s de prolines recombi- 
nantes. 

Par ailleurs, I'activite promotrice bidirectionnelle 
des sequences de ('invention peimet une utilisation 
particulierement avantageuse. Notamment, il est pos- 
sible d'utiliser ces sequences dans les 2 orientations 



possibles, pour I'expression simultanee de plusieurs 
genes de structure. 

Avantageusement, I'invention conceme ['utilisa- 
tion d'une sequence telle que precedemment definie 
5 pour I'expression simultanee, dans les 2 orientations 
opposees, de genes recombines. 

Avantageusement, les sequences de I'invention 
peuvent etre utilisees pour I'expression de genes co- 
dant pour des proteines d'interSt pharmaceutique ou 
w agroalimentaire. A titre d'exemple, on peut citer les 
enzymes (tels que notamment la superoxide dismuta- 
se, la catalase, les amylases, les lipases, les amida- 
ses, la chymosine etc.), les derives sanguins (tels que 
la serum-albumine, I'alpha- ou la beta-globine, le fac- 
ts teur VIII, le facteur IX, le facteur van Willebrand, la fh 
bronectine, I'alpha- 1 antitrypsine etc.), rinsuline et 
ses variants, les lymphokines (telles que les interteu- 
kines, les interferons, les facteurs de stimulation des 
colonies (G-CSF, GM-CSF, M-CSF,..), le TNF, le TRF 
20 etc.), les facteurs de croissance (tels que I' hormone 
de croissance, l'erythropoietine, le FGF, i'EGF, le 
PDGF, le TGF etc.), les apolipoproteines, des poly- 
peptides antigeniques pour la realisation de vaccins 
(hepatite, cytomegalovirus, Eppstein-Barr, herpes 
25 etc.), ou encore des fusions de polypeptides telles 
que notamment des fusions comportant une partie ac- 
tive fusion nee a une partie stabilisatrice (par exemple 
des fusions entre I'albumine ou des fragments d'albu- 
mine et le recepteur ou une partie d'un recepteur de 
30 virus (CD4, etc)). 

L' invention sera plus completement decrite a 
I'aide des exemples qui suivent, qui doivent etre 
consideres comme illustratifs et non limitatrfs. 

35 LEGENDE DES FIGURES 

Figure 1 : Sequence nucleotidique de la region de 
2,2 kb du fragment chromosomique situe en 
amont du codon d'initiation de la traduction du 
40 gene PGK de K. lactis possedant I'activite promo- 

trice. 

Figure 2 : Analyse des phases ouvertes de lectu- 
re. Les demi-traits verticaux represented des co- 
dons d'initiation de la traduction. Les traits vertl- 

45 caux en tiers represented des codons stop. Les 

regions claires mettent en Evidence les phase ou- 
vertes de lecture (ORF X et ORF PGK). 
Figure 3 : Carte de restriction du plasmide 
pYG610. La region noire correspond a la region 

so isolee du genome de K. lactis . 

Figure 4 : Strat£gie de sequengage du fragment 
Xba l de 2,5 kb. 

Figure 5 : Sequence et localisation des oligo- 
deoxy nucleotides utilises dans la reaction de 
55 PCR, pour 1'insertion d'un site Hindlll en -6 de 

I'ATG de la sequence de la figure 1. Les oligo- 
deoxy nucleotides sont represents en italique. 
L'ATG correspond au codon d'initiation de la tra- 
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duction du gene PGK. 

Figure 6 : Sequence nucleotidique de la region in- 
tergSnique du fragment 2,2 kb. 6(a) : oligodeoxy- 
nucleotides utilises dans la reaction de PCR. 
6(b) : Fragment Sal(l)- Hind lll correspondant aux 
nucleotides 1343 a 2246 sur la sequence de la fi- 
gure 1. 

Figure 7; Strategic de construction du plasmide 
pYG45. 

Figure 8 : Strategie de construction de cassettes 
d'expression de la s6rum-albumine humaine. 
Figure 9 : Strategie de construction du plasmide 
pYG65. 

Figure 1 0: Strategie de construction du plasmide 
pYG70. 

Figure 11 : Strategie de construction du plasmide 
pYG72. 

Figure 12 : Strategie de construction du vecteur 
pYG621. 

Figure 13 : Mise en evidence par "Northern blot" 
de ('expression du gene de I'albumine humaine 
sous la d6pendance du promoteur PGK de K.lac- 
tis. Les echantillons correspondent a 1 0\xg d'ARN 
total. 1 8S et 28S sont les positions des ARN ribo- 
somiques 1 8S et 28S. ALB = fragments recon nus 
par la sonde correspondant au gene de I'albumi- 
ne; URA = fragments reconnus par la sonde 
correspondant au gene URA A de KJactis servant 
de temotn de depdt. 

Figure 14 : Mise en Evidence de la production 
d'albumine dans les souches transformers par le 
vecteur d'expression pYG621 contenant le pro- 
moteur PGK de K-lactis . Les 6chantillons corres- 
pondent a 30 u.I de sumageant de culture ; les 
bandes au niveau du marqueur 66 kd correspon- 
dent a I'albumine. M = marqueurs de masse mo- 
leculaire : anhydrase carbonique bovine (31 Kd), 
ovalbumine (45Kd), BSA (66Kd), phosphorylase 
b de lapin (92kd). 

EXEMPLES 

1/ Isolement de la region promotrice du gene PGK 
de K lactis. 

La sequence presentee sur la figure 1 a ete ob- 
tenue par criblage d'une banque d'ADN genomique 
total de Kluyveromyces lactis CBS2359 au moyen 
d'une sonde heterologue provenant du gene PGK de 
S. cerevisiae (Dobson et al., Nucleic Acid Res. 1982, 
1 0, 2625). Plus pr6cis6ment, la sonde utilisee corres- 
pond au fragment N-terminal Pvul-EcoRI de 1,3 kb du 
gene PGK de S. cerevisiae . 

En "Southern blot" (Southern et al., J.Biol.Chem., 
1975, 98, 503), la sonde utilised s'hybride avec deux 
fragments differents lorsque I'ADN genomique est di- 
gere par XBal. L'un d'eux, de 2,5 kb environ, a ete iso- 
le par criblage d'une banque genomique restreinte de 



K. lactis CBS2359, constituee de fragments d'ADN 
coup6s par Xbal, d'une taille comprise entre 2 et 3 kb, 
introduits dans le plasmide pUC18 au site Xba l. Une 
banque de 500 clones a ainsi et6 constituee, puis cri- 

5 blee avec la sonde heterologue decrite ci-dessus. 

Par hybridation sur colonies, un clone a pu §tre 
identify et son ADN plasmidique a ete prepare. Ce 
plasmide (pYG610) contient un fragment d'ADN ge- 
nomique de 2,5 kb, dont la carte de restriction est pre- 

w sentee a la figure 3. Le plasmide pYG611 contient le 
m§me insert dans la direction opposed (voir figure 8). 

Dans une seconde etape, le fragment de 2,5 kb 
ainsi isole a ete sequence, en utilisant la methode de 
Sanger (Sanger et al., Proc.NaLAcad.Sci 74, 1977, 

15 5463). Pour eel a, le fragment issu de pYG611 a 
d'abord 6t6 sous-clone dans les bacteriophages 
M1 3tg1 30 et M1 3_tg1 31 . La strategie de sequencage 
du fragment est schematisee sur la figure 4. 

L'analyse de la sequence obtenue montre que le 

20 fragment isole contient une partie codant pour la re- 
gion N-terminale de la proline Pgk de Kluyveromy- 
ces lactis (0,3 kb), et 2,2 kb correspondant a la region 
promotrice situee en amont du site d* initiation de la 
traduction. Elle montre de plus que, dans I'orientation 

25 oppos6e par rapport au gene PGK , se situe une se- 
conde phase de lecture situ6e a environ 0,9 kb en 
amont de I'ATG du gene PGK (figure 2). 

La comparison de cette sequence avec celle du 
promoteur du gene PGK de S. cerevisiae fait apparan 

30 tre ('absence d'homologie particuliere, notamment 
avec son element de regulation. Cette sequence 
correspond done a une region promotrice entierement 
originale, tres distincte de celles deja decrites, sur le 
plan de sa structure, et par consequent sur le plan de 

35 sa regulation. 

21 Construction de vecteurs d'expression pour la 
production de proteines heterologues : 

40 Cet exemple illustre ('utilisation des capacites 

promotrices de (a sequence de 2,2 kb de la sequence 
de la figure 1 et de sequences derivees. 

a) Insertion d'un site de restriction en -6 de I'ATG. 

45 

L'insertion de ce site permet ensuite d'introduire 
en aval du promoteur obtenu tout gene que Ton desire 
exprimer. Pour des raisons de compatible avec des 
vecteurs d'expression existant (EP 361 991), des pro- 
50 moteurs "portables" ont 6te constants sous forme de 
fragments Sall- Hind lM. 

Un site Hindi 1 1 a ete introduit en position -6 par 
rapport au site d'initiation de la traduction (ATG) du 
gene PGK en utilisant la technique d'amplification par 
55 PCR (Mullis et al., Meth.Enzymol. 155, 1987, 335). 
Dans ce but, 2 oligodeoxynucleotides ont ete utilises, 
qui sont presentes sur la figure 5. 

L'oligodeoxy nucleotide A correspond a la se- 

4 
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quence situee a 467 pb en amont du codon ATG, au 
niveau d'un site Hind lll, qui sera ainsi remplace par un 
site SaH tors de ['amplification. L'ol i god eoxy nucleoti- 
de B correspond a la sequence en amont du site d'ini- 
tiation, et permet d 'introduce un site Hindl ll en posi- 
tion -6. 

Le fragment obtenu par PCR a ete insere entre 
les sites Sail et Hindl ll du bacteriophage M13tg130 
a fin de verifier par sequencage que des mutations ne 
sont pas apparues lors de ('amplification. 

b) Construction de cassettes d 'express ion de la 
serum- albumine humaine : figure 8. 

L'ADN recombinant de 474 pb obtenu ci-dessus 
a ete introduit au niveau des sites Sai l et Hind lll, dans 
le plasmide pYG45 (figure 7) pour obtenir le vecteur 
pYG614 (figure 8). Le plasmide pYG45 contient une 
cassette d'expression constitute du promoteur et du 
terminateur du gene PGK de S. cerevisiae entre les- 
quels, au niveau d'un site Hind lll, est insere le gene 
codant pour la pre pro-serum-albu mine humaine (se- 
quence prepro-HSA). pYG45 est derive de pYG18 
(voir brevet EP 361 991) par sous-clonage du frag- 
ment Sall - BamHI contenant la cassette d'expression 
HSA, dans les sites correspondents du vecteur pIC- 
20RDH (figure 7). plC-20RDH est obtenu par diges- 
tion du plasmide plC-20R (March et al. t Gene 32, 
1984, 481) avec I'enzyme Hind lll, remplissage des 
extre mites avec le fragment Klenowde la polymerase 
I d' E.coli et recircularisation avec la T4 DNA ligase. 

A partir du plasmide pYG614, le fragment Sal l- 
Sac l peut etre isole par digestion. II contient : une re- 
gion promotrice derivee de la sequence de la figure 1 , 
le gene de Palbumine et le terminateur du gene PGK 
de S. cerevisiae . II constitue une cassette d'expres- 
sion qui peut etre inseree dans un plasmide pour 
constituer un vecteur d'expression. 

Une autre cassette d'expression peut Stre obte- 
nue a partir du plasmide pYG61 4, par clonage du frag- 
ment Afllll- Sac l contenant une partie du promoteur 
PGK de ('invention, le gene de r albumine (prepro- 
HSA) et le terminateur PGK de S. cerevisiae dans (e 
plasmide pYG611 decrit prealablement. Ceci genere 
le plasmide pYG615. Le fragment Sall- Sac l conte- 
nant : la region promotrice de la figure 1 entiere, le 
gene codant pour la prepro-serum-albumine, et le ter- 
minateur du gene PGK de S. cerevisiae, peut ensuite 
etre isole par digestion. Ce fragment constitue une se- 
cond e cassette d'expression de I'albumine utilisant la 
sequence promotrice de I'invention. 

c) Construction de vecteurs d'expression de 
I'albumine. 

Des vecteurs d'expression de I'albumine peuvent 
£tre constants par insertion des cassettes d'expres- 
sion obtenues ci-dessus dans des plasmides navet- 



tes K.lactis/E.coli tels que pYG72 (figure 10). En par- 
ticulier, un vecteur d'expression a ete obtenu (vecteur 
pYG621) par insertion du fragment Sall- Sac l de 
pYG61 5 contenant la cassette d'expression de I'albu- 

5 mine dans le vecteur pYG72 (voir figure 1 0). Ce vec- 
teur correspond au plasmide pKan 707 (voir EP 361 
991) dans lequel le fragment Sac l contenant le gene 
URA 3 a ete elimine, ainsi que le site unique Hindl ll 
present dans I e gene aph pour faciliter les construc- 

10 tions ulterieures. Le gene aph code pour I'aminogly- 
coside 3'- phosphotransferase (I) (Oka et al., J. Mol- 
Biol. 147 , 1981, 217) et est utilise comme marqueur 
de resistance au G418 chez la levure. Le fragment 
Pstl du plasmide pKan707 contenant le gene aph a 

15 ete sous-clone dans le bacteriophage M13mp7 pour 
donner le vecteur pYG64 (figure 9). Le site Hind lll pre- 
sent dans ce gene a ete detruit par mutagenese diri- 
gee selon la methode decrite par Taylor et al. (Nucleic 
Acid Res. 13, 1985, 8749). Le plasmide resultant a ete 

20 appele pYG65 (figure 9). L'oligodeoxynucleotide uti- 
lise pour la mutagenese avait la sequence 5'-GAA 
ATG CAT AAG CTC TTG CCA TTC TCA CCG -3' et 
transformait le triplet CTT codant pour Tacide amine 
185 (Leu) en CTC. Ce changement ne modifie pas la 

25 sequence proteique resultante. Pour construire le 
plasmide pYG72, la partie contenant le replican bac- 
terien du vecteur pKan707 a ete isolee par digestion 
avec i'enzyme EcoR I et recircularisation avec la T4 
DNA ligase pour obtenir pYG69. Le fragment Pstl pre- 

30 sent dans ce dernier vecteur contenant le gene aph a 
ete remplace par le fragment equivalent mute prove- 
nant de pYG65. Cette construction a ete appelee 
pYG70. La sequence de pKD1 de4,7 kb comprise en- 
tre les sites EcoR I et Sac l a ete introduite dans ce der- 

35 nier vecteur pour obtenir pYG72. Le vecteur pYG621 
(figure 1 1 ) a 6te obtenu par insertion du fragment Sall- 
Sac l contenant la cassette d'expression de I'albumine 
provenant de pYG615. 

40 3/ Construction d'une cassette permettant d'utiliser 
la region promotrice dans les 2 orientations . 

Cette construction a ete obtenu e par introduction 
d'un site Sail et d'un site Hind lll de part et d'autre de 
45 la region comprise entre les 2 phases ouvertes de lec- 
ture identifiees sur la figure 2: ORF PGK et ORF X, 
soit au niveau des nucleotides 1343 et 2246 sur la fi- 
gure 1 . 

Cette construction a ete realisee par la technique 
so de PCR en utilisant d'une part l'ol igod eoxy nucleotide 
A qui introduit un site Sai l en position -1 par rapport 
au site d'initiation de la traduction du gene PGK, et 
d'autre part l'oligodeoxynucleotide B qui introduit un 
site Hind lll en position -1 par rapport au site d'initia- 
55 tion de la traduction du gene X (voir figure 6(a)). En- 
suite, pour eliminer un site Hindl ll present dans la re- 
gion promotrice, 3 reactions de PCR ont ete effec- 
tuees en utilisant a chaque etape le plasmide pYG61 0 

5 



9 



EP0 511 912 A1 



10 



comme matrice : 

- les 2 premieres, pour amplifier les regions de 
part et d'autre du site Hind lll en utilisant les oligo- 
d6oxynuel6otides A et B couples respectivement 
aux oligodeoxynucleotides C et D (figure 6). Ces 5 
2 derniers sont compl6mentaires et permettent 
d'introduire une mutation ponctuelle au niveau du 

site Hind lll interne ; 

- la derntere, en utilisant les 2 prod u its d'amplifi- 
cation precedents comme amorce, pour gen6rer 10 
le fragment final contenant la region promotrice 
modifiee. 

Cette region peut ensuite etre introduite dans les 
vecteurs decrits dans I'exemple 2, et utilis£e comme 
promoteur bidirectionnel. is 

4/ Expression d'albumine 

Le vecteur pYG621 a 6t6 introduit par transforma- 
tion dans la souche K.lactis MW98-8C (CBS 579.88), 20 
en utilisant la technique 6thyl6ne glycol/dim6thylsul- 
foxyde (Durrens et al., 1 990, Curr.Genet. 1 8 ( 7). Cette 
souche derive de la souche sauvage CBS2359 et pr6- 
sente le g6notype : Mat_, uraA, LysA, argA, K+, cir. 
Les levures transformees sont s6lectionn6es pour le 25 
phSnotype ^IS-resistant" que confere le plasmide 
pYG621 sur milieu YPD (extrait de levure 10 g/l t pep- 
tone 20 g/l, glucose 20 g/l) contenant de la gen6ticine 
a 0,2 g/l. Des souches transform6es par le plasmide 
pYG72 ne contenant pas de cassette d'expression 30 
ont ete s6lectionnees pour servir de t6moin dans les 
tests de production. Par ailleurs, afin de comparer Tef- 
ficacite du promoteur PGK de K.lactis selon I'inven- 
tion par rapport a celui de S.cerevisiae , des souches 
transform6es par le vecteur pYG1 9 ont 6galement 6te 35 
s6lectionnees. Le vecteur pYG19 est analogue au 
vecteur pYG621, sauf que le g6ne de I'albumine est 
sous le controle du promoteur PGK de S.cerevisiae 
(EP 361 991). 

40 

a) Analyse des ARNm : 

Les cellules sontcultiv6es a 28°C en milieu s6lec- 
tif YPD (extrait de levure 10 g/l, peptone 20 g/l, gluco- 
se 20 g/l) contenant de la gen6ticine a 0,2 g/l. Les 45 
ARN totaux sont extraits (Sherman et al., Methods in 
Yeast Genetics, Cold Spring Harbor Laboratoty, 
1986, 143) et s£par£s par 6lectrophorese sur gel 
d'agarose. Suivant la methode de "Northern blot" 
(Maniatis et al., 1982 Molecular cloning, Cold Spring so 
Harbor, Laboratory Press), les ARN sont hybrides a 
une sonde correspondant au gfene de structure de I'al- 
bumine (fragment Hindlll-Hindlll de 1,9 kb) provenant 
du vecteur pYG18 (figure 7). L'autoradiographie mon- 
tre clairement une bande de 2,3 kb sp^crfique de I'al- 55 
bumine (figure 13). Par ailleurs, il apparait clairement 
que le taux de transcription du gene de I'albumine est 
bien sup6rieur dans les souches contenant une re- 



gion promotrice de ('invention (pYG621), que dans 
celles contenant le promoteur PGK intact de S. cere- 
visiae (pYG19). 

b) Analyse des prolines : 

Les cellules sont cultivees en erlenmeyers dans 
un milieu s6lectif YPD (extrait de levure 10 g/l, pepto- 
ne 20 g/l, glucose 20 g/l) contenant de la g6neticine 
a 0,2 g/l a 28°C sous agitation. Apr&s 96 heures de 
culture, 30 \i\ de sumageant sont pr6lev6s et m6lan- 
g6s a un volume Equivalent de tampon Laemmli 2X 
(Laemmli, 1970, Nature 227, 680). Aprfes chauffage a 
96°C pendant 10 minutes, les prolines de I'gchantil- 
lon sont ensuite s6parees sur gel de polyacrylamide 
SDS 8,5 %. La production d'albumine est ensuite re- 
v6l6e par coloration du gel au bleu decoomassie, puis 
est gvaluee pour les differents vecteurs utilises. La fi- 
gure 14 montre que les 4 clones obtenus s£par6ment 
par transformation de la souche MW98-8C par le vec- 
teur pYG621 secr&ent beaucoup plus d'albumine 
que ceux obtenus par transformation avec le vecteur 
pYG19. 

II est clair que la region promotrice de I'invention 
permet une excellente production d'albumine par la 
levure, sup6rieure a celle obtenue avec le promoteur 
PGK de S.cerevisiae . Cette region, ou des formes r6- 
duites ou d6riv6es de celle-ci, constituent un outil 'In- 
dustrie I important pour les systemes de production 
microbiologiques, et plus particuli&rement eucaryo- 
tes. 



Revendications 

1 . Sequence d'ADN comprenant tout ou partie de la 
sequence pr£sent£e a la figure 1 ou de son brin 
compl6mentaire, ou d'un d6riv6 de celles-ci, et 
poss£dant une activite de promoteur transcrip- 
tionnel. 

2. Sequence d'ADN selon la revendication 1 
comprenant tout ou partie de la sequence presen- 
tee sur la figure 6(b). 

3. ADN recombinant comprenant une sequence 
d'ADN selon les revendications 1 ou 2. 

4. ADN recombinant selon la revendication 3 carac- 
t£ris6 en ce qu'il contient en outre un ou plusieurs 
genes de structure. 

5. ADN recombinant selon la revendication 4 carac- 
t£ris6 en ce qu'il contient ggalement des signaux 
permettant la secretion du prod u it d'expression 
du ou des d its g£nes de structure. 

6. ADN recombinant selon Tune quelconque des re- 
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vendications 3 a 5 caracterise en ce qu'il fait par- 
tie d'un plasmide d'expression, qui peut etre a re- 
plication autonome ou integrate. 

7. Cellule recombinee contenant une sequence 5 
d'ADN ou un ADN recombinant selon Tune quel- 
conque des revendications precedentes. 

8. Cellule recombinee selon la revendication 7 ca- 
racterisee en ce qu'il s'agit d'une levure. 10 

9. Cellule recombinee selon la revendication 8 ca- 
racterisee en ce qu'il s'agit d'une levure du genre 
Kluyveromyces. 

15 

10. Utilisation d'une sequence d'ADN selon I'une 
quelconque des revendications 1 a 6 pour ('ex- 
pression de genes recombines. 

11. Utilisation selon la revendication 10 pour I'ex- 20 
pression simultanee, dans les 2 orientations op- 
posees, de genes recombines. 

12. Utilisation selon I'une des revendications 10 ou 

11 pour ('expression de genes codant pour des 25 
proteines d'interet pharmaceutique ou agroali- 
mentaire. 

13. Procede de preparation d'une proteine recombi- 
nante par expression de son gene dans un hdte 30 
cellulaire caracterise en ce que ('expression dudit 
gene est sous le control e d'une sequence selon 

la revendication 1. 

14. Procede selon la revendication 1 3 caracterise en 35 
ce que (a proteine est la serum-albumine humai- 

ne. 
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10 20 30 40 50 60 

TCTAGATTTA GCGGGTCATC GAAATTTAGT AGCGAGTCTA TTAGGGACCA GAGTTGCAAC 

70 80 90 100 110 120 

CTGAGGTTTA ATGCGTCATC CTGTCGTTGC ITCAAGTTCC CCACTTGAAT CACTTGGACA 

130 140 150 160 170 180 

AACCGTTTCA TTGGTTTGAG GAAGGTGACG GATCTGGGTA GAAACTGGAC TACTGCATCT 

190 200 210 220 230 240 

GTTGGTAGTC TTGATGCCAT GGTGATGAGC CATTGCCATT GGAAAAGAGT GAATTCAGAT 

250 260 270 280 290 300 

TCCAAGATTT GGTCAATGAT TGATTTTGTA AGATTGAGAT CGTAATCCTG ATACTCTTTG 

310 320 330 340 350 360 

AGCCATGTTT CCAACAGTTC TTCGGAATCT GCCGGTGTGG AAACGAGTAT TTCGGAGTAC 

370 380 390 400 410 420 

AATCTCGGTG GTTGCGTTAT CTGAGAGGAT GGTGTAGTGG TTTGATGTTG CTGTGTGAAA 

430 440 450 460 470 480 

GATGATGCAG AGCTGATCAA CGATTCGAAC TGGGAGATCA CTTCGTTCAC TTCTTCCTGG 

490 500 510 520 530 540 

TTCCCGTTAC CTGTTTGCGT TTCCTCATAC ATTGGTACGC TATCCTCATC TTCAGATAAC 

550 560 570 580 590 600 

GAAATATCAA ACTCATCGGA ATCGGACGCG TCGTTCAAAT CGCCCTCATC CTTGGTAATG 

610 620 630 640 650 660 

TTCTTGAACC GGTCGAGAAG GTTGAGAATC TCTGTCGGAA CACCACCCTG CGGCGTATAC 

670 680 690 700 710 720 

CAGAACCAGA ATAAATTGTA GCACATCTTA ACTTTCTCTA AGGAAACATC TGAACTCTGA 

730 740 750 760 770 780 

TCAACGCATT CCGTAAGTAT ACTGTTTGCC TTGTCTCTGG TGAATTTATG AGGGTAAGAC 

790 800 810 820 830 840 

TCTGAGATCA TAAGTAACTG TTGAGCATCG AAGTTGTTGT AGTTTGAAAT TAGGGATCTG 

850 860 870 880 890 900 

GAAAGATGCG GTACCACTGC TTTGATGACA TTATCTGGCG GGTTCAACGG TACCAATTCC 

910 920 930 940 950 960 

TGCAAGAATA GCGAATCCAA CGGTTTTAAC TCAGAGTAAT GGTTGATCAA CTCGATGAAA 

970 980 990 1000 1010 1020 

ACGTCCCAAT GGATGGATTG CATCAAGTGT TGATGTTCCA CCAAATTAAG ACAATATTTC 

1030 1040 1050 1060 1070 1080 

GTAACGTTTT CGAGTGAAAC TGACACGGGC CTGCCCTCAG CACTCGTAGA CACGAGTAAC 

1090 1100 1110 1120 1130 1140 

GTCTTGAGAC CTCTCGTACA GGGAAGCGAC ATATCGTTCA ATAGACTATG GAACAAAGTG 

1150 1160 1170 1180 1190 1200 

TACACCGCAG CGATATCCTT GCATTTGCAA AACGATTGAA TAAGTGACGT CGATGCTAAA 

1210 1220 1230 1240 1250 1260 

TCCTGGATAA GTACGCTGGT ATCGTGTAAG CCCATGAGAA CGACACGTTC CTCATCACTA 



FIGURE 1 
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1270 1280 1290 1300 1310 1320 

GAAGCCGAAC TGTTGTCTTC AGTGGGGATT GGTTCGACAT TTTGCCAATT GCTGTCGATG 

1330 1340 1350 " 1360 1370 1380 

TACCCTTTCA AAGCCATGTA CCTTAAATCT TCATCCTTGG CAAGTAGATT CATCGGGTGT 

1390 1400 1410 1420 1430 1440 

GTTTGAAGTA AGAATATTTG CTTGTTTTTA TGGTATCAAA GGTATATGTT GTAGAAGACA 

1450 1460 1470 1480 1490 1500 

ATTTCCGGTA ATCCAATTGT CTGTCTGCTC AGTTTAGCAC ATGTATAGTA CGTTGCACAT 

1510 1520 1530 1540 1550 1560 

AGTCTACAAT ATTCAGCATT CAGCATTCAG TATACAGCAT ATGGCTAAAT GATCACAAAT 

1570 1580 1590 1600 1610 1620 

GTGATTGATG ATTTGACACG ACTAGAAAAG AGAACGAAAA AGGGAAATTC ATGTCACGTG 

1630 1640 1650 1660 1670 1680 

CGTTGGCACG TGACATGGAA TATCGAAGAA AGAAAAAAAA AAACGATCTC GTCCTAGTGG 

1690 1700 1710 1720 1730 1740 

AAGCCCAGAG TCTGGTCCCC CCGGAGTCTT CCCAAAACAA GAAGCTGACA CATGTTGACA 

1750 1760 1770 1780 1790 1800 

CAGAACACCC CACAGCAAAT .GCACCACGCT ACGTAGATCA GGAAGCTTAA CTCTAGCGAC 

1810 1820 1830 1840 1850 1B60 

CTGTCGCTCG CCCCACAGAA CCTCACCCGA GAACCACACA TTACACGCCG CCAGCTCCCA 

1870 1880 1890 1900 1910 1920 

CTATACTCAT CTTGCTTCCC TTAAGCGTTC TCACGATTCG TTCGCTGCCC TTCTTCAAGA 

1930 194 ° 1950 I960 1970 1980 

GTCTTCTGAT TCTAATTCTC ATTCGAAATC CTCTACAGTT AATGAATTGC TTGACATGAC 

1990 2000 2010 2020 2030 2040 

ATTCATTGTC TCATGGTTTT GGCTTTTTGG CTTTTGTCTT TTAAAGCTAT ATCAACTTTA 

2050 2060 2070 2080 2090 2100 

CATftTAAATfi TftCGTCAAAA GGGGATTCAT TAATTAGAAA ATTCTCTTTT TCAATAGTTG 

2110 2120 2130 2140 2150 2160 

CTATTCATTA TCAATCTATT CAACTCAATT GGTTATTATT TTCATCTTTT TGTCATCCTA 



2170 
AACCATCAAC 



2180 2190 2200 2210 2220 

HCTGTT GCTACATTAA GAGTTAC TTC AGAAAT&Ada 



2230 2240 2250 

AAAAAATCGA TCAAGAATTA ATAAAAATG 

Met 



FIGURE 1 (suite) 
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FIGURE 2 
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FIGURE 3 
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Xbal EcoRI Mlul 



Kpnl 
1/ i 



Hindlll 



PGK K.I 



Xbal 



figure a 



Sail 

A 

5 ' GGGAATTCGTCGA 

CTTAA CTCTAGCGA CCTGTC 3 9 

3 • TTCGAATTGAGATCGCTGGACAGGCAGCGGGGT 5 % 

5' 3' 

-4 67 

Hindi I I 



3' 5' 

5 • CAAAAAAATCGATCAAGAATTAATAAAAATG 3 ' 

3 9 GTTTTTTTAGCTAGTTCTTAATT 

TCGAACTTAAGGG 5 9 

B 

Hindlll 



FIGURE 5 
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01igod6soxynucl6otide A 
5 • CAT£I£GA£TTTTTATTAATTCTTGATCGAT3 1 
Sail 

Oligod6soxynucl6otide B 

5 1 ATGAAGCT2AAATCTTCATCCTTGGC3 1 

Hindlll 
01igod6soxynucleotide C 

5 1 GGGTGAGGTTCTGTGGGGCGAGCGACAGGTCGCTAGAGTTAAGCATCCTGATC3 • 
(Position: 439 a 492) 

01igod§soxynucl6otide D 

5 ' GATCAGGAXGCTTAACTCTAGCGACCTGTCGCTCGCCCCACAGAACCTCACCC3 1 
(Position: 439 a 492) 



Hindlll 10 20 30 40 50 60 

flfl<3CttTTAA ATCTTCATCC TTGGCAAGTA GATTCATCGG GTGTGTTTGA AGTAAGAATA 60 
ttcgaaAATT TAGAAGTAGG AACCGTTCAT CTAAGTAGCC CACACAAACT TCATTCTTAT 
TTTGCTTGTT TTTATGGTAT CAAAGGTATA TGTTGTAGAA GACAATTTCC GGTAATCCAA 120 
AAACGAACAA AAATACCATA GTTTCCATAT ACAACATCTT CTGTTAAAGG CCATTAGGTT 
TTGTCTGTCT GCTCAGTTTA GCACATGTAT AGTACGTTGC ACATAGTCTA CAATATTCAG 180 
AACAGACAGA CGAGTCAAAT CGTGTACATA TCATGCAACG TGTATCAGAT GTTATAAGTC 
CATTCAGCAT TCAGTATACA GCATATGGCT AAATGATCAC AAATGTGATT GATGATTTGA 240 
GTAAGTCGTA AGTCATATGT CGTATACCGA TTTACTAGTG TTTACACTAA CTACTAAACA 
CACGACTAGA AAAGAGAACG AAAAAGGGAA ATTCATGTCA CGTGCGTTGG CACGTGACAT 300 
GTGCTGATCT TTTCTCTTGC TTTTTCCCTT TAAGTACAGT GCACGCAACC GTGCACTGTA 
GGAATATCGA AGAAAGAAAA AAAAAAACGA TCTCGTCCTA GTGGAAGCCC AGAGTCTGGT 360 
CCTTATAGCT TCTTTCTTTT TTTTTTTGCT AGAGCAGGAT CACCTTCGGG TCTCAGACCA 
CCCCCCGGAG TCTTCCCAAA ACAAGAAGCT GACACATGTT GACACAGAAC ACCCCACAGC 4 20 
GGGGGGCCTC AGAAGGGTTT TGTTCTTCGA CTGTGTACAA CTGTGTCTTG TGGGGTGTCG 
AAATGCACCA CGCTACGTAG ATCAGG ATGC TT AACTCTAfl CGACCTGTCG CTCGCCCCAC 4 80 
TTTACGTGGT GCGATGCATC TAGTCCTACG AATTGAGATC GCTGGACAGC GAGCGGGGTG 
AGAACCTCAC CCGAGAACCA CACATTACAC GCCGCCAGCT CCCACTATAC TCATCTTGCT 540 
TCTTGGAGTG GGCTCTTGGT GTGTAATGTG CGGCGGTCGA GGGTGATATG AGTAGAACGA 
TCCCTTAAGC GTTCTCACGA TTCGTTCGCT GCCCTTCTTC AAGAGTCTTC TGATTCTAAT 600 
AGGGAATTCG CAAGAGTGCT AAGCAAGCGA CGGGAAGAAG TTCTCAGAAG ACTAAGATTA 
TCTCATTCGA AATCCTCTAC AGTTAATGAA TTGCTTGACA TG AC ATT CAT TGTCTCATGG 660 
AGAGTAAGCT TTAGGAGATG TCAATTACTT AACGAACTGT ACTGTAAGTA ACAGAGTACC 
TTTTGGCTTT TTGGCTTTTG TCTTTTAAAG CTATATCAAC TTTACATATA AATATACGTC 720 
AAAACCGAAA AACCGAAAAC AGAAAATTTC GATATAGTTG AAATGTATAT TTATATGCAG 
AAAAGGGGAT TCATTAATTA GAAAATTCTC TTTTTCAATA GTTGCTATTC ATTATCAATC 780 
TTTTCCCCTA AGTAATTAAT CTTTTAAGAG AAAAAGTTAT CAACGATAAG TAATAGTTAG 
TATTCAACTC AATTGGTTAT TATTTTCATC TTTTTGTCAT CCTAAACCAT CAACAATATT 840 
ATAAGTTGAG TTAACCAATA ATAAAAGTAG AAAAACAGTA GGATTTGGTA GTTGTTATAA 
TAAATATATC TGTTGCTACA TTAAGAGTTA CTTCAGAAAT AACAAAAAAA TCGATCAAGA 900 
ATTTATATAG ACAACGATGT AATTCTCAAT GAAGTCTTTA TTGTTTTTTT AGCTAGTTCT 
ATTAATAAAA Aatcaac o 17 
TAATTATTTT Tcagctg 

10 Sail 20 30 40 50 60 



FIGURE 6 
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Ndel 
BamHI 



Hindlll / 
Sail/ 




term. PQK S.c 
Hindlll 



prepro-HSA 



Hindlll 



prom. PGK S.C 



digestion Sail /BamHI 

isolation de la cassette d'expression 



Sail 




prom. PGK S.c 



Hindlll 
BamHI 



term. PGK S.C 



prepro-HSA 




t 

digestion Sail /BamHI 



ligation 



NdeLSacI 



BamHI 

term. PGK Sx 
Hindlll 



Sacl-7 
Sail/ 




prepro-HSA 



Hindlll 



prom. PGK S.c 



Figure 7 



EP 0 511 912 A1 




digestion AflH/SacI 




prepro-HSA 



Figure 8 
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EcoRI, 
Sad 



URA3 



gene C 




EcoRI 
Sac! 
Sail 
Pstl 

aph 

■Hindlll 



Pstl 



EcoRil bla 



digestion Pstl 



Pstl 



Hindlll 



Pstl 



aph 



EcoRI 
BamHI 
Sail 
Pstl 




Pstl 
Sail 
BamHI 
EcoRI 




EcoRI 

BamHI 

Sail 

Pstl 

Sail 

BamHI 

EcoRI 



digestion Pstl 



ligation 




EcoRI 
BamHI 
Sail 
Pstl 



aph 
Hindlll 



Pstl 
Sail 

BamHI 
EcoRI 



mutag6n£se dirig^e 



Figure 9 
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EcoRI, 
Sad 



URA3 



gene C 




EcoRI 
Sad 
Salt 
Pstl 

aph 

-Hindlll 



Pstl 



EcoRI 
BamHI 
Sail 
Pstl 




Pstl 
Sail 
BamHI 
EcoRI 



bla 



EcoRI" bla 



digestion EcoRI 
ligase ADN T4 



Pstl 



digestion Pstl 




aph 



Hindlll 



ligation 



digestion Pstl 



bla 



Figure 10 
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gene A 



Figure 11 
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gene A 



digestion Sall/SacI 
ligation 




gene C 



Figure 12 
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FIGURE 13 
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